跳到正文

AI 幻觉:为什么会胡说 + 5 个减幻招式

🎯 这一篇读完,你应该能:

  • 理解 AI 幻觉的根本机制(不是 bug,是设计本身)
  • 分得清"事实型 / 推理型 / 引用型" 三种幻觉
  • 掌握 5 个减幻招式,叠加用能砍掉 80%+ 错答
  • 知道哪些场景下幻觉代价最大、必须额外防

1. 幻觉的本质:概率最优 ≠ 事实最优

AI 给你的每一个回答,本质上都是"概率最优"——它在算"在这上文之后,最可能出现的下一段话是什么"。当它训练时见过类似问题、答案高频,就答得准;没见过、训练数据有偏、问题太边缘,它依然会按"看起来最像答案"的方向编一个出来。它不会主动说"我不知道",这是模型架构决定的,不是"AI 不够诚实"。

💡 类比一下:一个嘴硬的实习生。你问他"这个 API 怎么调用?"他没看过文档,但为了不显得不会,就编一个看起来很合理的答案给你。AI 默认就是这个嘴硬实习生。

2. 三种典型幻觉

类型表现例子
事实型编造不存在的事实"Anthropic 成立于 2019"(实际 2021)
推理型过程错但结论说得很顺算数题中间一步算错,最终答案错得理直气壮
引用型编出不存在的文献、链接、API"参考 React 官方文档 useAsyncEffect"(这 API 根本不存在)

3. 为什么会发生:4 个根本原因

  1. 训练数据空缺——问得太冷门,模型见过的样本不够
  2. 时效失效——训练数据有截止日期,问到截止后的事情就开始编
  3. 领域错配——拿通用模型问极专业问题(医疗 / 法律 / 特定 API)
  4. 问题歧义——你的问题本身有多种解读,AI 顺着一个就走

4. 减幻 5 招(叠加用效果好)

招式怎么做大致砍幻效果
RAG 检索增强把权威资料喂给 AI 作为回答依据40-60%
明确边界Prompt 里加"不知道就直接说不知道,不要猜"15-25%
自一致性 Self-Consistency同一问题问 3-5 次,多数投票10-20%
Cross-check让 AI 自己给的事实标"来源 / 不确定性"15-25%
步骤展示 CoT让 AI 把推理过程写出来,错容易看出来10-20%

⚡ **叠加效果:**5 招齐上,复杂任务的事实错误率可以从原来的 30% 砍到 5% 以下。最 ROI 高的两招是 RAG + 明确边界

5. 这些场景必须警惕幻觉

  • 医疗 / 法律 / 财务——错答可能造成真实伤害,一定要交叉验证
  • API / 库函数——AI 经常编不存在的函数名,写代码时跑一遍才知道真假
  • 引用 / 出处——AI 编的论文 / 链接看起来非常真实,但常常根本不存在
  • 数字 / 日期 / 价格——这类数据 AI 错的概率很高,所有数字回到原始来源验证
  • 组合判断——"A 在 B 时候做了什么"这类问题容易把两件事拼错

延伸阅读


来源:飞书 · AI Spark 知识库 | 原文(最新版):https://lcnniolukk80.feishu.cn/wiki/E914wrridiL2TOk2ScgcKwdcnDd | 归档:2026-06-04